জেসুপ (JSoup) ব্যবহার করে HTML ফাইল লোড করা অত্যন্ত সহজ। এটি আপনার লোকাল বা রিমোট HTML ফাইলকে পার্স (parse) করতে সাহায্য করে। HTML ফাইল লোড করার জন্য JSoup এর Jsoup.parse() বা Jsoup.parseFile() মেথড ব্যবহার করা হয়।
HTML ফাইল লোড করার জন্য Jsoup.parseFile() ব্যবহার
Jsoup.parseFile() মেথড HTML ফাইল লোড করতে ব্যবহৃত হয়, যা আপনার লোকাল ডিরেক্টরি থেকে HTML ফাইল রিড করে এবং এটি একটি Document অবজেক্টে পরিণত করে। এই মেথডটি HTML ফাইলের পাথ নেয় এবং সেটিকে পার্স করে HTML ডকুমেন্ট হিসেবে রিটার্ন করে।
উদাহরণ:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.File;
import java.io.IOException;
public class JsoupExample {
public static void main(String[] args) {
try {
// লোকাল HTML ফাইল লোড করা
File inputFile = new File("path/to/your/file.html");
Document doc = Jsoup.parseFile(inputFile, "UTF-8");
// HTML ডকুমেন্টের শিরোনাম প্রিন্ট করা
System.out.println("Title: " + doc.title());
// HTML ডকুমেন্টের প্রথম h1 ট্যাগ প্রিন্ট করা
System.out.println("Heading: " + doc.select("h1").first().text());
} catch (IOException e) {
e.printStackTrace();
}
}
}
এই কোডে:
Jsoup.parseFile(inputFile, "UTF-8")মেথডটি লোকাল HTML ফাইল পার্স করে।- তারপর
doc.title()এবংdoc.select("h1").first()ব্যবহার করে HTML ডকুমেন্টের শিরোনাম এবং প্রথম h1 ট্যাগের কনটেন্ট এক্সট্র্যাক্ট করা হয়েছে।
HTML ফাইল লোড করার জন্য Jsoup.parse() ব্যবহার
Jsoup.parse() মেথডটি সাধারণত HTML কনটেন্ট স্ট্রিং পার্স করতে ব্যবহৃত হয়, তবে এটি ফাইল থেকেও HTML ডেটা রিড করতে পারে যদি আপনি ফাইলের কনটেন্টকে স্ট্রিং হিসেবে লোড করেন।
উদাহরণ:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
public class JsoupExample {
public static void main(String[] args) {
try {
// HTML ফাইলের কনটেন্ট স্ট্রিং হিসেবে রিড করা
File inputFile = new File("path/to/your/file.html");
String htmlContent = new String(Files.readAllBytes(inputFile.toPath()), "UTF-8");
// HTML কনটেন্ট পার্স করা
Document doc = Jsoup.parse(htmlContent);
// HTML ডকুমেন্টের শিরোনাম প্রিন্ট করা
System.out.println("Title: " + doc.title());
// HTML ডকুমেন্টের প্রথম h1 ট্যাগ প্রিন্ট করা
System.out.println("Heading: " + doc.select("h1").first().text());
} catch (IOException e) {
e.printStackTrace();
}
}
}
এখানে:
- ফাইলের কনটেন্ট
Files.readAllBytes()মেথড দিয়ে স্ট্রিং আকারে রিড করা হয়েছে। - তারপর
Jsoup.parse()মেথড দিয়ে HTML কনটেন্ট পার্স করা হয়েছে।
সারাংশ
JSoup ব্যবহার করে HTML ফাইল লোড করা খুবই সহজ এবং সরল। Jsoup.parseFile() মেথড HTML ফাইল সরাসরি লোড করে পার্স করতে সাহায্য করে, আর Jsoup.parse() মেথড HTML কনটেন্ট স্ট্রিং আকারে প্রক্রিয়া করতে ব্যবহৃত হয়। এই দুইটি পদ্ধতি আপনার লোকাল বা রিমোট HTML ডকুমেন্ট থেকে ডেটা এক্সট্র্যাক্ট করার জন্য কার্যকর।
Read more